#### PIPELINE COPROCESSOR

Publication number: KR20050084628 (A)

Publication date: 2005-08-26

MATHUR CHAN DAN [US]: HELLENBACH SCOTT [US]: RAPP JOHN W [US]: JACKSON LARRY [US]: JONES MARK [US]: CHERASARO TROY [US] Inventor(s):

LOCKHEED CORP [US]

Applicant(s): **Classifications** 

- international: G06F9/30; G06F9/38; G06F9/445; G06F9/46; G06F15/78;

G06F9/30; G06F9/38; G06F9/445; G06F9/46; G06F15/76;

(IPC1-7): G06F9/30; G06F9/38

906F9/3864 - European:

Application number: KR20057007748 20050430

Priority number(s): US20030683929 20031009; US20030683932 20031009;

US20030684053 20031009; US20030684057 20031009; US20030684102 20031009; US20020422503P 20021031

Abstract not available for KR 20050084628 (A)

Abstract of corresponding document: WO 2004042560 (A2)

A peer-vector machine includes a host processor and a hardwired pipeline accelerator. The host processor executes a program, and, in response to the program, generates host data, and the pipeline accelerator generates pipeline data from the host data. Alternatively, the pipeline accelerator generates the pipeline data, and the host processor generates the host data from the pipeline data. Because the peer-vector machine includes both a processor and a pipeline accelerator, it can often process data more efficiently than a machine that includes only processors or only accelerators. For example, one can design the peer-vector machine so that the host processor performs decision-making and non-mathematically intensive operations and the accelerator performs non-decision-making and mathematically intensive operations; By shifting the mathematically intensive operations to the accelerator, the peer-vector machine often can, for a given clock frequency, process data at a speed that surpasses the speed at which a processor-only machine can process the data.

Data supplied from the esp@cenet database -- Worldwide

Also published as:

WO2004042560 (A2) WO2004042560 (A3)

WO2004042574 (A2)

WO2004042574 (A3)

**WO2004042569** (A2)

\$1000 PP

#### KOREAN PATENT ABSTRACTS

(11) Publication number:

1020050084628 A

LOCKHEED MARTIN CORPORATION

(43) Date of publication of

26.08.2005

application:

(71) Applicant:

(21) Application

1020057007748

number:

(22) Date of filing:

30.04.2005

(30) Priority:

2003 683929 US 09.10.2003

(51) Int. CI:

G06F 9/30 (2006.01); G06F 9/38 (2006.01);

MATHUR CHAN DAN (72) Inventor: HELLENBACH SCOTT RAPP JOHN W. JACKSON LARRY JONES MARK

CHERASARO TROY

(54) PIPELINE COPROCESSOR

#### (57) Abstract:

A peer-vector machine includes a host processor and a hardwired pipeline accelerator. The host processor executes a program, and, in response to the program, generates host data, and the pipeline accelerator generates pipeline data from the host data. Alternatively, the pipeline accelerator generates the pipeline data, and the host processor generates the host data from the pipeline data. Because the peer-vector machine includes both a processor and a pipeline accelerator, it can often process data more efficiently than machine that includes only processors or only accelerators. For example, one can design the peer-vector machine so that the host processor performs decisionmaking and non-mathematically intensive operations and the accelerator performs non-decision-making and mathematically intensive operations. By shifting the mathematically intensive operations to the accelerator, the peer-vector machine often can, for a given clock frequency, process data at a speed that surpasses the speed at which a processor-only machine can process the data.



© KIPO & WIPO 2007

This Facsimile First Page has been artificially created from the Korean Patent Abstracts CD Rom

# (19)대한민국특허청(KR) (12) 공개특허공보(A)

| (51) . Int. Cl. <sup>7</sup><br>G06F 9/30<br>G06F 9/38 |                                                                                                                                                                                                                                                                                                              |                                     | 1) 공개번호<br>3) 공개일자 | 10-2005-0084628<br>2005년08월26일 |
|--------------------------------------------------------|--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-------------------------------------|--------------------|--------------------------------|
| (21) 충원변호<br>(22) 충원원자<br>번역문 제송일자                     | 10~2005~7007748<br>2005년04월30일<br>2005년04월30일                                                                                                                                                                                                                                                                |                                     |                    |                                |
| (86) 국계출원번호                                            | PCT/US2003/034557                                                                                                                                                                                                                                                                                            | (8                                  | 7) 号利署用也宽          | WO 2004/042560                 |
| 국제출원일자                                                 | 50034104314                                                                                                                                                                                                                                                                                                  |                                     | 국제공개일자             | 2004년05월21일                    |
| (30) 우설권주장                                             | 10/683,929                                                                                                                                                                                                                                                                                                   | 2003년10월09일                         | 미국(U               | 5)                             |
|                                                        | 10/683,932                                                                                                                                                                                                                                                                                                   | 2003년10월09일                         | n 强(C)             | š)                             |
|                                                        | 10/684,053                                                                                                                                                                                                                                                                                                   | 2003년 10월09월                        | 이국(U               | 3)                             |
|                                                        | 10/684,057                                                                                                                                                                                                                                                                                                   | 2003년10월09일                         |                    |                                |
|                                                        | 10/684,102                                                                                                                                                                                                                                                                                                   | 2003년 10월09월                        |                    |                                |
|                                                        | 60/422,503                                                                                                                                                                                                                                                                                                   | 2002년10월31월                         | 이국(U               | \$)                            |
| (71) 총원인                                               | 목히드 마틴 교포데이션<br>미국 비지니아주 20110, 마나사스, 골윈 드라이브 9500, 메일 드톱 043, 빌딩 400                                                                                                                                                                                                                                        |                                     |                    |                                |
| (72) 발명자                                               | 매류, 센단<br>미국 비지니아 20109, 매나사스, 프라이베이츠 코트 11162<br>헬렌마호, 스콧<br>미국 비지니아 20106, 아메스틸, 쿠아일 리지 드라이보 15381<br>켈, 존 더블튜<br>미국 비지니아 20110, 매나사스, 리비 크레스트 로드 9350<br>잭슨, 테리<br>미국 비지니아 20112, 메나사스 크레스트북 드라이보 13093<br>존, 마크<br>미국 비지니아 20120. 셈트레틸, 오크메어 플레이스 15342<br>게라사로, 트로이<br>미국 비지니아 22701. 컬페퍼, 캐스트랑 코트 1524 |                                     |                    |                                |
| (74) 대리인                                               | 선생일<br>설루석                                                                                                                                                                                                                                                                                                   | , , , , , , , , , , , , , , , , , , |                    |                                |
| 성사공구 : 없음·                                             | ~ ` '                                                                                                                                                                                                                                                                                                        |                                     |                    |                                |

# (54) 파이프라인 코프로세서

32.04

피어-벡터 여신에는 호스트 프로세서 및 하드라이어드 라이프라인 가속기가 포함되어 있다. 상기 호스트 프로세서는 프로그램을 실행하고, 상기 프로그램에 용답하여, 호스트 데이터를 생성하며, 상기 파이프라인 가속기는 상기 호스트 데이터 로부터 파이프라인 데이터를 생성한다. 선택적으로, 상기 파이프라인 가속기는 상기 파이프라인 데이터를 생성한다. 선택적으로, 상기 파이프라인 가속기는 상기 파이프라인 데이터를 생성하고, 상기

호스트 프로세서가 상기 파이프라인 테이터로부터 상기 호스트 테이터를 생성한다. 상기 피어-벡터 미신에는 프로세서와 파이프라인 가속기가 모두 포함되어 있기 때문에, 프로세서만 포함하거나 또는 가속기만 포함하는 머신보다 훨씬 효과적으로 테이터를 처리할 수 있다. 예를 들어, 설계자는 호스트 프로세서가 결정-형성 및 수학적으로 집중적인 연산을 수행하고 상기 가속기가 비-결정-형성 및 수학적으로 집중적인 연산을 수행하도로고 피어-벡터 비신을 설계할 수 있다. 상기 수학적으로 집중적인 연산을 가속기로 시프트 함으로써, 피어-벡터 머신은 주어진 끝목 주파수에서 프로세서만 있는 머신이데이터를 처리하는 속도보다 훨씬 빠른 속도로 데이터를 처리할 수 있다.

48 M M

*5*2.3

की हो हते

피어-벡터 미신, 콰이프라인, 콰이프라인 코프로세서

평계시

2]会长中

(우선권 주장)

본 출원은 참고문헌으로서 통합되는 2002년 10월 31일 출원된 미국 가출원 제60/422,503호의 우선권을 주장한다.

(관련된 총원파의 상호왕조)

본 출원은 발명의 명칭이 "항상된 컴퓨팅 아키텍처를 가지는 컴퓨팅 머신 및 관련 시스템 및 방법"인 미국 목허출된 제 10/684,053호, 발명의 명칭이 "항상된 컴퓨팅 아키텍처를 위한 파이프라인 가속기 및 관련 시스템 및 방법"인 미국 목허출된 제 8원 제10/683,929호, 발명의 명칭이 "프로그램가능한 최로 및 관련 컴퓨팅 머신 및 방법"인 미국 목허출인 제10/684,057호, 및 발명의 명칭이 "다중 파이프라인 유닛을 가지는 파이프라인 가속기 및 관련 컴퓨팅 미신 및 방법"인 미국 목허출원 제 10/684,932호와 관련이 되어 있으며, 상기 미국 목허출원 발명은 모두 2003년 10월 9일 동일한 권리자에 의해 출원되었으며, 본 명세시에 참고문헌으로 통합된다.

해정기술

상대적으로 짧은 시간에서 상대적으로 대용량의 데이터를 처리하기 위한 일반적인 컴퓨팅 아기택처(computing architecture)에는 부하를 분배하는 나중 상호점속 프로세서(multiple interconnected processor)가 포함되어 있다. 처리 부하를 분배함으로써, 이를 다중 프로세서들은 주어진 물목 주과수에서 하나의 프로세서가 할 수 있는 것 보다 더욱 빨리데이터를 처리할 수 있다. 예를 들어, 프로세서 각각은 데이터의 일부를 처리 하거나 또는 처리되는 알고리품 일부를 실행할 수 있다.

도 1은 다중~표표세서 아키텍처를 갖는 종래의 컴퓨팅 마신(computing machine)(10)의 계략적인 볼록 다이어그램이다. 미신(10)에는 마스티 프로세서(12) 및 버스(16)를 통해 상기 마스터 프로세서와 상호 통신을 하는 코프로세서(14<sub>1</sub>-14<sub>4</sub>), 원격 장치(도 1에는 도시하지 않음)로부터 원 데이터(raw data)를 수신하는 입력 포트(18), 및 처리된 데이터를 상기 원격소으로 제공하는 출력 포트(20)가 포함되어 있다. 상기 미신(10)에는 또한 마스터 프로세서(12)을 메모리(22), 코프로세서(14<sub>1</sub>-14<sub>8</sub>)을 메모리(24<sub>1</sub>-24<sub>8</sub>), 및 상기 머스(16)를 통해 마스터 프로세서와 코프로세서가 공유하는 메모리(26)도 포함되어 있다. 메모리(22)는 마스터 프로세서(12)를 위한 프로그램 및 작업 메모리 모두의 역할을 하고, 메모리(24<sub>1</sub>-24<sub>4</sub>) 각각은 코프로세서(14<sub>1</sub>-14<sub>8</sub>) 각각을 위한 프로그램 및 작업 메모리 모두의 역할을 한다. 공유 메모리(26)는 마스터 프로세서(12)의 코프로세서(14)가 그들 사이의 데이터를 모트(18 및 20)을 통해 각각 원격 장치로/장치로부터 건당할 수 있게 해준다. 마스터 프로세서(12) 및 코프로세서(14)는 또한 마신(10)이 원 데이터를 처리하는 속도를 제어하는 공통의 물목 신호를 수신하기도 한다.

일반적으로, 컴퓨팅 미선(10)은 마스티 프로세서(12)와 코프로세서(14) 간의 원 데이터 처리를 효과적으로 분배한다. 소나 어래이(sonar array)(도 5)와 같은 원격 소스(도 1에는 도시하지 않음)는 포트(18)를 통해 원 데이터를 상기 원 데이터를 위한 선임선출(FIFO) 버터(도시하지 않음)로서 작동하는 공유 메모리(26)의 일부에 로드한다. 마스터 프로세서(12)는 버스(16)를 통해 메모리(16)로부터 원 데이터를 검색하고, 마스터 프로세서(와 코프로세서(14)가 상기 원 데이터를 처리하고, 버스(16)를 통해 필요한 만큼 그들사이에서 데이터를 전달한다. 마스티 프로세서(12)는 처리된 데이터를 공유 메모리(26)에 집의되어 있는 다른 FIFO 버퍼(도시하지 많음)에 모드하고, 원격 소스가 포트(20)를 통해 이 FIFO 로부터 상기 최리된 데이터를 검색한다.

다른 연산의 예에서, 컴퓨팅 미선(10)은 원 데이터를 처리하는데 있어서 상기 원 데이터상에서 각각의 연산에 n+ 1을 순 차적으로 수행하여 처리하는데, 이 연산은 페스트 푸리에 변환(FFT)과 같은 처리 알고리즘을 함께 구성한다. 보다 특별하게는, 미선(10)은 마스터 프로세서(12)와 코프로세서(14)로부터 데이터 저리 파이프라인을 행성한다. 주어전 활폭 신호의 주파수를 위해, 그러한 파이프라인은 충충 미선(10)이 하나의 프로세서만 가지는 미선보다 더욱 빠르게 된 데이터를 처리 할 수 있게 한다.

메모리(26)비의 원-데이터 FIFO(도시하지 않음)로부터 된 데이터를 검색한 후, 마스터 프로세서(12)는 삼각 항수와 같은 제1 연산을 상기 된 데이터상에 수행한다. 이 연산은 프로세서(12)가 메모리(26) 내부에 정의된 제1-절과 FIFO(도시하지 않음)내에 저장하는 첫번째 결과를 산술해 낸다. 일반적으로, 프로세서(12)는 메모리(12) 내에 저장된 프로그램을 수행하며, 그 프로그램의 제어하에 상기 설명된 연산들을 수행한다. 프로세서(12)는 또한 메모리(22)를 작업 메모리로 사용하여 프로세서가 상기 제1 연산의 중간 시간에 생성하는 데이터를 일시적으로 저장하기도 한다.

다음으로, 상기 메모리(26)내의 제1-절과 FIFO(도시하지 않음)로부터 첫번째 결과를 검색한 후, 코프로세서(14)는 로그 항수와 같은 두번째 연산을 상기 첫번째 결과상에 수행한다. 이 두번째 연산은 코프로세서(14<sub>1</sub>)가 메모리(26) 내부에 정의된 제2-결과 FIFO(도시하지 않음)내에 저장하는 두번째 결과를 산출해 낸다. 일반적으로, 코프로세서(14<sub>1</sub>)는 메모리(24<sub>1</sub>)내에 저장된 프로그램을 수행하며, 그 프로그램의 제이하에 상기 설명된 연산들을 수행한다. 코프로세서(14)는 또한 메모리(24<sub>1</sub>)를 작업 메모리로 사용하여 코프로세서가 삼기 제2 연산의 중간 시간에 생성하는 데이터를 일시적으로 저장하기도 한다.

그리고 나서, 코프로세서(24g-24g)는 상기 두번째-(n-1)번째 상에 세번째-n번째 연산을 순차적으로 수행하여 상기 코 프로세서(24g)를 위해 상기 설명한 것과 유사한 방법의 결과를 가져온다.

- 코프로세서(24g)에 의해 수행되는 n번째 면단은 최종 결과, 즉 처리된 데이터를 산출한다. 코프로세서(24g)는 메모리 (26) 내무에 정의된 처리된-데이터 FIFO(도시하지 않음)로 이 처리된 데이터를 로드(load)하고, 원격 장치(도 1에는 도시하지 않음)가 이 FIFO로부터 상기 처리된 데이터를 검색한다.

마스터 프로세서(12)와 코프로세서(14)가 처리 알고리츔의 다른 연산을 통시에 수행하기 때문에, 컴퓨팅 머신(10)은 서로 다른 연산을 순차적으로 수행하는 하나의 프로세서를 갖는 컴퓨팅 머신 보다도 된 데이터를 보다 빨리 처리할 수 있기도 하다. 특히, 하나의 프로세서는 원 데이터의 앞 세트상에 모든 n+1 연산을 수행할 때 까지는 원 데이터의 새로운 세트를 검색할 수 없다. 그러나, 상기 연급한 파이프라인 기술을 이용해서, 마스티 프로세서(12)는 요작 첫번째 연산을 수행한 후 원 데이터의 새로운 세트를 검색할 수 있다. 따라서, 주어진 물목 주파수를 위해, 이 파이프라인 기술은 머신(10)이 원 데이터를 처리하는데 있어서 하나의 프로세서 머신(도 1에는 도시하지 않음)과 비교할 때 대략 n+1 팩터 만큼 원 데이터를 처리하는 속도를 증가시킬 수 있다.

선택적으로, 컴퓨팅 머신(10)은 원 데이터상에, FFT 와 같은 저리 앞고리즘의 경우에 n+1을 통시에 수행함으로써 병렬로 원 데이터를 처리할 수도 있다. 즉, 알고리즘에 앞서의 실시에에서 상기 언급한 바와 같은 n+1 순차적 연산이 포함되어 있다면, 마스터 프로세서(12)와 코프로세서(14) 작작은 모든 n+1 연산을 원 데이터 작작의 세트상에서 수행한다. 따라서, 주어진 물목 주파수를 위해서는, 상기 설명한 파이프라인 기술과 같이, 이러한 병멸-처리 기술은 머신(10)이 하나의 프로세서 머신(도 1에는 도시하지 않음)과 비교할 때 대략 n+1 백터 만큼 원 데이터 처리 속도를 증가시킬 수 있다.

불행하게도, 비혹 컴퓨팅 마신(10)이 하나의 프로세서 컴퓨터 마신(도 1에는 도시하지 않음)보다 빨리 데이터를 처리할 수는 있으나, 며신(10)의 데이터-처리 속도가 풍종 프로세서 물록의 주파수보다 적이지곤 한다. 특히, 컴퓨팅 머신(10)의 데이터-처리 속도는 마스터 프로세서(12)과 코프로세서(14)가 데이터를 처리하는데 요구하는 시간에 의해 제한된다. 간 탁히 하기 위해, 이 속도 제한의 한 예를 마스티 프로세서(12)를 참고하여 설명하는데, 이 설명은 코프로세서(14)에도 적용 됨을 이해할 수 있을 것이다. 앞에서 설명한 바와 같이, 마스티 프로세서(12)는 프로세서를 제어하여 테이터를 원하는 방 식으로 조작하도록 제어하는 프로그램을 실행한다. 이 프로그램에는 프로세서(12)가 실행하는 일련의 명령이 포함되어 있 다. 불행하게도, 프로세서(12)는 일반적으로 하나의 명령을 수행하는데 다음 물목 사이물을 필요로 하는데, 품품 다음 명 명을 수행하여 데이터의 하나의 값을 처리해야 한다. 예를 들어, 프로세서(12)가 제1 데이터 값(A)(도시하지 않음)과 제2 데이터 값(B)(도시하지 않음)을 꼽하는 경우를 가정한다. 제1 물목 사이를 동안, 프로세서(12)는 메모리(22)로부터 여러게 의 명령을 검색한다. 제2 및 제3 물목 사이를 돌안, 프로세서(12)는 메모리(22)로부터 A와 B를 각각 검색한다. 제4 물목 사이를 동안, 프로세서(12)는 A와 B를 꼽하고, 제5 물목 사이를 동안, 그 절과물을 메모리(22 또는 26)에 저장하거나 또는 그 결과물을 원격 장치(도시하지 않음)로 제공한다. 이것은 최선의 시나리오인에, 그 이유는 많은 경우에서, 프로세서(12)는 카운터를 초기화(initializing) 및 단는(closing) 경우와 같이 오비해드 테스크(overhead task)를 위한 추가의 물목 사이 물을 요구하기 때문이다. 그러드로, 프로세서(12)는 A와 B를 처리하기 위해서는 5개의 물목 사이물, 또는 데이터 값 당 평 균 2.5개의 물목 사이물을 필요로 한다.

따라서, 컴퓨팅 미년(10)이 데이터를 처리하는 속도는 종종 마스터 프로세서(12) 및 코프로세서(14)를 구통하는 물목의 주파수보다 크게 낮이지곤 한다. 예를 들어, 프로세서(12)가 1.0 기가레르프(GHz)에서 블록되지만 데이터 값 당 평균 2.5 물목 사이활을 요구한다면, 유효 데이터-처리 속도는 (1.0GHz)/2.5=4GHz 가 될 것이다. 이 유효 데이터-처리 속도는 종 조당 연산 단위로 목정되곤 한다. 그러므로, 1.0GHz 의 활목 속도를 위해서는, 프로세서(12)는 초당 0.4 기가연산(Gops)의 데이터-처리 속도로 레이트(rate)되어야 한다.

도 2는 프로세서가 주어진 물목 주파수 및 중중 파이프라인이 물목되는 레이트와 거리 동일한 레이트에서 할 수 있는 것보다 더 빠른 일반적인 데이터를 처리할 수 있는 하도와이어도(hardwired) 데이터 파이프라인(30)의 불리 다이어그램이다. 파이프라인(30)에는 각각 실행 프로그램 명령 없이 각각의 테이터상의 개발적 연산을 각각 수행하는 연산자 회로 (32<sub>1</sub>-32<sub>n</sub>)가 포함되어 있다. 즉, 원하는 연산이 최로(32)로 "번 되는(burned in)" 것으로 프로그램 명령 없이도 자동적으로 연산을 실행하는 것이다. 실행 프로그램 명령과 관련된 오비해드를 제어함으로써, 파이프라인(30)은 종종 주어진 물목 주파수를 위해 할 수 있는 것보다 더 많은 연산을 수행할 수 있다.

예를 들어, 파이프라인(30)은 프로세서가 주어진 물목 주파수를 위해 할 수 있는 것 보다 더 빠른 다음과 같은 수석을 풀 수 있다.

$$Y(X_k) = (5X_k + 3)2^{xk}$$

여기서, Xk는 일련의 원 데이터 값을 나타낸다. 이 예에서, 연산자 최로(32<sub>1</sub>)는 5Xk 를 제산하는 품셈기이고, 최로(32<sub>2</sub>)는 5Xk + 3 를 제산하는 가산기이며, 최로(32<sub>2</sub>)(n=3)는 (5Xk + 3)2<sup>xk</sup> 를 제산하는 품셈기이다.

제1 물목 사이물 k=1 동안, 회로(32,)는 데이터 값(X,)을 수신하고 여기에 5를 곱해 5X, 를 생성한다.

- 제2 물목 사이를 k=2 동안, 회로(32<sub>2</sub>)는 회로(32<sub>1</sub>)로부터 5X<sub>1</sub>을 수신하고, 3을 대해서 5X<sub>1</sub> + 3 을 생성한다. 또한, 상기 제2 물목 사이를 동안, 최로(32<sub>1</sub>)는 5X<sub>2</sub> 를 생성한다.

제3 물목 사이럴 k=3 동안, 회로(32 $_3$ )는 최로(32 $_2$ )로부터  $5X_1+3$ 은 수신하고,  $2^{X^1}$  (x1 반품 유효하게  $5X_1+3$  오른쪽 시프트)를 꼽하여 첫번째 결과( $5X_1+3$ )2 $^{X^1}$ 을 생성한다. 또한, 제3 물목 사이를 동안, 회트(32 $_1$ )는  $5X_3$ 를 생성하고 회트 (32 $_2$ )는  $5X_3$ + 생성한다.

파이프라인(30)은 이러한 방식으로 모든 원 테이터 값이 처리될 때 까지 연속적인 원 테이터 값(X,)을 계속 처리한다.

따라서, 된 데이터  $\&(X_1)$ 을 수신한 후 두 개의 물목 사이들의 지연 ~ 이 지연을 파이프라인(30)의 레이턴시(latency)라고 부르픈 할 ~ 상기 파이프라인은 결과  $(5X_1+3)2^{x1}$  을 생성하고, 그 후에 하나의 결과를 각각의 물목 사이물을 생성한다.

상기 레이턴시를 무시하면, 파이프라인(30)은 물목 속도와 동일한 데이터-처리 속도를 갖는다. 비교를 하면, 마스터 프로 세시(12)와 코프로세시(14)가 상기 예에서와 같은 물목 속도의 0,4배의 데이터-처리 속도를 갖는다고 가정하면, 파이프라인(30)은 주어진 물목 속도를 위해 컴퓨팅 미신(10)(도 1)보다 2,5배 빨리 데이터를 처리할 수 있다.

도 2를 계속 참조하면, 설계자는 파이프라인(30)을 될도-프로그램가능한 게이트 어레이(FPGA)와 같은 프로그램가능한 보지 IC(PLIC)에서 수행하도록 선택하기도 하는데, 그 이유는 PLIC 는 주문형 반도체(ASIC)보다 나온 디자인 및 변형 유용성 가진다. PLIC 내무에서 하드와이어도 접속을 구성하기 위해서는, 설계자는 단지 PLIC 내무에 배치된 상호점속-구성 레지스터를 미리 결정된 이전 상태(binary stste)로 설정하기만 하면 된다. 이를 이전 상태 모두의 조합을 "됨웩어(firmware)"라고 부르곤 한다. 인반적으로, 설계자는 이 평웨어를 PLIC 와 관합된 비휘발성 메모리(도 2에 도시하지 않음)에 로드한다. 누군가가 PLIC 를 "커먼(turn on)", PLIC는 상기 메모리로부터 컴웨어를 상기 상호점속-구조 레지스터로 다운로드한다. 그러므로, PLIC 의 기능을 변경시키기 위해서는, 설계자는 단지 컴웨어를 수정하면 되고 PLIC 로 하여를 그 수정된 컴웨어를 상호점속-구조 레지스터로 다운로드하게 하면 된다. 이것은 단지 컴웨어를 수정하는 것에 의해 PLIC를 수정할 수 있다는 것은 시계품화 단계 동안 및 "필드 내에서" 파이프라인(30)의 업그레이드를 위해 특히 유용하다.

불행하게도, 하드와이어도 파이프라인(30)은 중요한 결정 청성을 필요로 하는 모든 알고리즘을 실행하지 못한다. 프로세서는 비교 가능한 길이의 연산 명령(예를 들어, "A+B")를 실행할 수 있는 정도로 거의 빠르게 일반적으로 결정-평성 명령 (예를 들어, "A이면 B로 가고, 그렇지 않고 C로 가고"와 같은 조건 명령)를 실행할 수 있다. 그러나, 비록 파이프라인(30)이 상대적으로 간단한 결정(예를 들어, "A>B?")을 구성할 수 있어도, 일반적으로는 상대적으로 복잡한 결정(예를 들어, "A이면 B로 가고, 그렇지 않으면 C로 가고")을 실행하지 못한다. 그리고, 비폭 그러한 복잡한 결정을 실행하기 위해 파이프라인(30)을 디자인할 수 있다 하여도, 요구되는 최로의 크기와 복잡성은 종종 설계를 불가능하게 만드는데, 특히 여러개의 서로 다른 복잡한 결정을 포함하는 알고리즘인 경우 그러하다.

- 따라서, 프로세서는 중요한 결정 현성을 요구하는 애플리케이션 내에서 종종 사용되며, 하드와이어드 파이프라인은 결정 현성이 거의 없는 또는 전혀 없는 "수치처리(number crunching)" 애플리케이션으로 세한되곤 한다.

더욱이, 아래에 설명한 바와 끝이, 도 2의 파이프라인(30)과 같은 하드와이어도 파이프라인, 특히 여러개의 PLIC를 포함하는 파이프라인(30)을 설계/수정하는 것 보다는 도 1의 컴퓨팅 머신(10)과 같은 프로세서~기반 컴퓨팅 머신을 설계/수정하는 것 보다는 도 1의 컴퓨팅 머신(10)과 같은 프로세서~기반 컴퓨팅 머신을 설계/수정하는 것이 훨씬 쉽다.

프로세서와 그 주변장치를(예쁠 들어, 메모리)와 같은 컴퓨팅 구성요소들은 일반적으로 이 구성요소들의 상호접속을 촉 진하여 프로세서~기반 컴퓨팅 머신을 협성하기 위한 산업~표준 통신 인터페이스를 포함한다.

특히, 표준 통신 인터페이스에는 두 개의 계층(layer)이 포함되는데, 물리 계층과 서비스 계층이다. 물리 계층에는 최로 및 이 회로의 연산 과라메터 및 인터페이스를 형성하는 대응 최로 상호점속이 포함되어 있다. 예를 들어, 물리 계층에는 구성요소를 비스와 연결하는 편, 이 편으로부터 데이터를 래치(latch)하는 비퍼, 및 이 편상에서 데이터를 구동시키는 구동기가 포함되어 있다. 장기 연산 과라메터에는 상기 편이 수신하는 데이터 신호의 허용가능한 권압 범위, 데이터를 기록 및 판독하는 신호 타이잉, 및 지지된 연산 모드(예를 들어, 버스트 모드, 페이지 모드)가 포함되어 있다. 종래의 물리 계층에는 트랜지스터-트렌지스터 논리(TTL) 및 캠비스(RAMBUS)가 포함된다.

서비스 계층에는 컴퓨팅 구성요소가 태이터를 전송하는 프로토콜이 포함된다. 이 프로토콜은 데이터의 포맷 및 상기 구성요소가 포맷된 데이터를 송수신하는 방식을 정의한다. 총래의 통신 프로토콜에는 과일-전송 프로토콜(PTP) 및 화장이 포함된다.

따라서, 산업·표준 통신 계층을 갖는 제조자 및 다른 일반적인 설계 컴퓨팅 구성요소물로 인해서, 그러한 구성요소의 인 터페이스를 일반적인 설계로 할 수 있고 이것을 상대적으로 적은 노력으로 다른 컴퓨팅 구성요소물과 상호점속시킬 수 있다. 이것은 설계자에게 대부분의 시간을 컴퓨팅 머신의 다른 부분들을 설계하는데 소비하게 안들고, 구성요소들을 추가하지나 없애는 것을 통해 미신을 쉽게 수정할 수 있게 한다. 선업-표준 통신 제충을 지원하는 컴퓨팅 구성요소를 설계하는 것은 설계 라이브리리(design library)로부터 현존하는 물리-계출 설계를 사용하여 설계 시간을 절약하게 해 준다. 이것은 또한 구성요소들은 제고품인 컴퓨팅 구성요소들과 쉽게 접속할 수 있게 해주기도 한다.

공통의 산업-표준 통신 계층을 지원하는 컴퓨팅 구성요소를 사용하여 컴퓨팅 머신을 설계하는 것은 설계자로 하여금 시간과 노력을 줄여꾸면서 구성요소들을 삼호점속할 수 있게 해 준다. 이를 구성요소를이 공통의 인터페이스 계층을 지원하기 때문에, 설계자는 설계 노력을 거의 들이지 않고 시스템 비스를 통해 이들을 상호 접속할 수 있다. 지원되는 인터페이스 계층이 산업 표준이기 때문에, 설계자는 머신을 쉽게 수정할 수 있다. 예를 들어, 설계자는 다른 구성요소 및 주변장치들을 미신에 추가하여 시스템 설계를 발전시켜 나갈 수 있으며, 또는 차세대 구성요소들을 쉽게 추가/설계하여 기술 발견을 이를 수 있다. 더욱이, 구성요소들이 공통의 산업-표준 서비스 계층을 지원하기 때문에, 설계자는 컴퓨팅 미신의 소프트웨어로 대응하는 프로트플을 설련하는 현존하는 소프트웨어 모듈을 합체시킬 수 있다. 따라서, 설계자는 인터페이스 설계가 이미 적절하게 될수적이기 때문에 거의 노력을 들이지 않고 구성요소들을 접촉시킬 수 있어서 미신이 특정 기능을 수행하게 하는 미신의 일부(예를 들어, 소프트웨어)를 설계하는 매주력할 수 있다.

- 그러나, 불행하계도, 도 2의 파이프라인(30)과 같은 하드와이어드 파이프라인을 형성하는데 사용되는 PLIC 등과 같은 구 성요소를 위한 알려진 산업~표준 통신 제충은 없다.

따라서, 여러개의 PLIC 를 갖는 파이프라인을 설계하기 위해서, 설계자는 "스크레치(scratch)로부터" PLIC 간의 통신 계충을 설계하고 디버킹라는데 상당한 시간과 노력을 들여야 한다. 일반적으로, ad hoc 통신 계충은 PLIC 간에서 전달되는데이터의 파라메터에 따라 달라진다. 비슷하게, 프로세서와 접속되는 파이프라인을 설계하기 위해서는, 설계자는 스크레치로부터 파이프라인과 프로세서간의 통신 개충을 설계하고 디버킹하는데 상당한 시간과 노력을 들여야 한다.

비슷하게, PLIC 을 추가하는 것으로 파이프라인을 수정하기 위해서는, 설계자는 일반적으로 추가된 PLIC와 현재의 PLIC 사이의 통신 계층을 설계하고 디비깅하는데 상당한 시간과 노력을 들어게 된다. 그리고, 프로세서를 추가하는 것으로 파이프라인을 수정하려면, 또는, 파이프라인을 추가하는 것으로 컴퓨팅 머신을 수정하려면, 설계자는 파이프라인과 프로세서간의 통신 계층을 설계하고 디비깅하는데 상당한 시간과 노력을 들어야 한다.

그러므로, 또 1 및 도 2를 참고하면, 다수의 PLIC 를 접속하고 파이프라인과 프로세서의 접속 이러용으로 인해, 설계자는 컴퓨팅 머신을 설계하는 경우 상당한 트레이드오프(tradeoff)에 직면하곤 한다. 예를 들어, 프로세서-기반 컴퓨팅 머신을 가지고는, 설계자는 복잡한 결정-형성 가능성을 위한 트레이드 수-크린칭 속도 및 설계/수정 유연성에 집중하게 된다. 만대로, 하드와이어도 와이프라인-기반 컴퓨팅 미신을 가지고는, 설계자는 수-크린칭 속도를 위한 트레이드 복잡성-결정-형성 가능성 및 설계/수정에 집중하게 된다. 더욱이, 다수의 PLIC를 접속하는데의 어려움으로 인해, 소수의 PLIC를 가지는 파이프라인-기반 미신을 설계하는 것이 불가능하기도 하다. 그 결과, 실제적인 과이프라인-기반 미신은 제한된 기능을 갖곤 한다. 그리고, 프로세서와 마이프라인을 합성으로 인해서, 하나의 PLIC 이상과 프로세서와의 접속이 불가능하기도 하다. 그 결과, 프로세서와 과이프라인을 합성으로써 얻어지는 이익이 적다.

따라서, 하드와이어드-파이프라인-기반 미선의 수-크린청 속도를 가지고 프로세서-기반 미신의 결정-형성 가능성을 결합시킬 수 있는 새로운 컴퓨터 아키텍처 요구가 있어 왔다.

방병의 상세한 설명

#### (\$2R)

본 발명의 한 실시에에서, 피어-벡터 머신에는 호스트 프로세서 및 하드와이어드-와이프라인 가속기가 포함되어 있다. 상기 호스트 프로세서는 프로그램을 실행하고, 그 프로그램에 응답하여, 호스트 데이터를 생성하고, 상기 와이프라인 가속 기는 상기 호스트 데이터로부터 과이프라인 테이터를 생성한다.

- 본 발명의 다른 실시에에 따르면, 상기 파이프라인 가속기는 상기 파이프라인 테이터를 생성하고, 상기 호스트 프로세서 는 상기 과이프라인 데이터로부터 상기 호스트 데이터를 생성한다. 상기 피어~벡터 미산에 프로세서와 하드와이어드 가속기가 모두 포함되어 있기 때문에, 프로세서만 포함하는 또는 하드 와이어드 파이프라인만 포함하는 컴퓨팅 미산보다 효과적으로 데이터 처리를 할 수 있다. 예를 들어, 설계자는 상기 호스트 프로세서가, 상기 가속기가 수확적으로 집중 연산을 수행하는 동안, 결정~형성 및 비~수학적 집중 연산을 수행하도록 피어 벡터 미산을 설계할 수 있다.

도면의 강당한 설명

도 1은 총래의 다중~프로세서 아기텍처를 갖는 컴퓨팅 미신의 불력 다이어그램이고,

도 2는 종례의 하드와이어드 파이프라인의 불리 다이어그램이고,

도 3은 본 발명이 일 실시에에 따른 피어-벡터 아키텍처를 갖는 컴퓨팅 머신의 계략적인 불력 다이어그램이고,

도 4는 본 발명의 일 실시에에 따른 도 3의 피어-벡터 컴퓨팅 여신을 통합하는 전차 시스템의 계략적 불력 다이어그램이다.

생산회

#### (상세한 설명)

도 3은 본 발명의 일 실시에에 따른 피어-벡터 아키텍처를 갖는 컴퓨팅 미선(40)의 계략적인 불력 다이어그램이다. 호스트 프로세서(42)에 추가하여, 상기 피어-벡터 미선(40)에는 적어도 일부의 테이터 처리를 수행하여 도 1의 컴퓨팅 미선(10) 내의 코프로세서(14)의 랭크(bank)를 유효하게 대체하는 파이프라인 가속기(44)가 포함되어 있다. 따라서, 호스트-프로세서(42) 및 가속기(44)는 테이터 벡터를 앞뒤로 건송할 수 있는 "피어(peer)" 이다. 가속기(44)는 프로그램 명령을 실행하지 않으므로, 가속기는 종종 코프로세서의 뱅크가 주어진 물목 주파수에서 할 수 있는 것보다 훨씬 빠르게 테이터상의 집중적인 연산을 수학적으로 처리한다. 따라서, 프로세서(42)의 결정-형성 가능성과 가속기(44)의 수-크린정 가능성을 결합하고 보세, 미선(40)은 동일한 능력을 갖지만, 미선(10)과 같은 중래의 컴퓨팅 미신보다는 빠르게 테이터를 처리할 수 있다. 또한, 앞서 연급한 발명의 명칭이 "COMPUTING MACHINE HAVING IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 특히출원 제10/684,053호 및 발명의 명칭이 "PIPELINE ACCELERATOR POR IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 특히출원 제10/683,929호에 설명된 마와 같이, 가속기(44)에 상기 호스트 프로세서(42)의 통신 계층을 제공하는 것은 미선(40)의 설계 및 수정을 용이하게 해 주고, 특히, 프로세서의 통신 제층이 산업 표준인 경우 그러하다. 가속기(44)에 다수의 구성요소(예를 들어, PLIC)이 포함되어 있는 경우, 이들 구성요소에 동일한 계층을 제공하는 것은 가속기의 설계 및 수정을 용이하게 해주는데, 특히 상기 통신 계층이 산업 표준과 호환되는 경우 그러하다. 더욱이, 머신(40)은 후술하는 바와 같은 그리고 앞서 언급한 다른 출원들에서의 다른 강점도 제공한다.

호스트 프로세시(42) 및 파이프라인 가속기(44)에 추가하여, 피어-벡터 컴퓨팅 미선(40)에는 프로세시 메모리(46), 인터페이스 메모리(48), 비스(50), 캠웨어 메모리(52), 선택적인 원-데이터 임력 포트(54,56), 처리된-메이터 출력 포트(58,60), 및 선택적인 라우터(61)가 포함되어 있다.

호스트 프로세서(42)에는 처리 유닛(62) 및 메시지 처리기(64)가 포함되어 있으며, 프로세서 메모리(46)에는 처리-유닛 메모리(66) 및 처리기 메모리(68)을 포함하는데, 각각 프로세서 유닛 및 메시지 처리기를 위한 프로그램 및 작업 메모리 모두의 역할을 한다. 프로세서 메모리(46)에는 가속기-구성 레지스트리(70) 및 메시지-구성 레지스트리(72)도 포함되어 있는데, 이들은 각각 호스트 프로세서(42)로 하여급 가속기(44)의 기능 및 메시지 처리기(64)가 생성하는 메시지의 구조를 구성하도록 하는 각각의 구성 데이터를 지장하고 있다.

파이프라인 가속기(44)는 적어도 하나의 PLIC(도시하지 않음)에 배치되어 있으며 프로그램 영령을 실행하지 않고 각각의 데이터를 처리하는 하드와이어도 파이프라인(74,-74,)을 포함하고 있다. 원웨어 메모리(52)는 가속기(44)을 구성 원래어를 저장한다. 만일 가속기(44)가 다수의 PLIC 에 배치된다면, 이를 PLIC 및 그를 각각의 범웨어 메모리는 다수의 최로보도, 즉 디터 카드(daughter card)(도시하지 않음)상에 배치된다. 상기 가속기(44)와 디커 카드는 앞서 언급한 발명의 명성이 "PIPELINE ACCELERATOR FOR IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD'인 미국 목허충된 제10/683,929호 및 발명의 명칭이 "PIPELINE ACCELERATOR HAVING MULTIPLE

PIPELINE UNITS AND RELATED COMPUTING MACHINE AND METHOD"인 미국 특허술원 제10/683,932호에 설명되어 있다. 선택적으로, 상기 가축기(44)는 적어도 하나의 ASIC 에 배치될 수 있으며, 따라서, 구성할 수 없는 내루 상호점속을 갖는다. 이 대안에서, 미선(40)에서 펌웨어 메모리(52)를 생략할 수 있다. 또한, 비록 가축기(44)가 다중 파이프라인(74)을 포함하는 것으로 도시되어 있으나, 오직 하나의 파이프라인만 포함할 수 있다. 또한, 비록 도시하시는 않았지만, 가축기(44)에는 디지털-선호 처리기(DSF)와 같은 하나 또는 그 이상의 프로세서가 포함될 수 있다.

또 3을 계속 참조하여, 피어~백터 미신(40)의 등작은 본 발명의 덜 실시에에 따라 후술한다.

## 꾀어~벡터 머신 구성

피어-벡터 미신(40)이 가장 먼저 활성화 되면, 처리 유닛(62)은 메시지 처리기(64) 및 파이프라인 가속기(44)(상기 가속 기는 구성가능함)를 구성하여 머신이 원하는 알고리즘을 실행할 수 있도록 한다. 폭히, 처리 유닛(62)은 메모리(66)내에 저장되어 있고 상기 처리 유닛으로 하여금 메시지 처리기(164)와 가속기(44)를 후술하는 바와 같이 구성하도록 만드는 호스트 매플리케이션 프로그램을 실행한다.

에서지 처리기(64)를 구성하기 위해서는, 처리 유닛(62)은 레지스트리(72)에서 에서지~포멪 정보를 검색하고 이 포엣 정보를 메모리(60)에 이 정보를 시장하는 메시지 처리기로 제공한다. 머신(40)이 후술하는 바와 같이 테이터를 처리하면, 메시지 처리기(64)는 이 포맷 정보를 사용하여 원하는 포맷을 갖는 데이터 메시지를 생성하고 관득한다. 한 실시예에서, 상기 포맷 정보는 화장성 생성 언어(XML)로 기록시며, 다른 언어나 다른 테이터 포멧으로 기록될 수도 있다. 상기 처리 유닛(62)이 삼기 메시지 처리기(64)를 상기 피어~벡터 머신(40)이 활성화 되는 시간마다 구성하기 때문에, 설계자는 레지스트리(72)에 저장되어 있는 포맷 정보를 단지 수정하는 것으로 메시지 포멧을 수정할 수 있다. 선택적으로, 외부 메시지~구성라이트러리(도시하지 않음)는 다중 메시지 포멧을 위한 정보를 제공할 수 있고, 설계자는 상기 처리 유닛(62)이 상기 라이브러리(도시하지 않음)는 다중 메시지 포멧을 위한 정보를 제공할 수 있고, 설계자는 상기 제리 유닛(62)이 상기 라이브러리의 선택된 부분에서 테지스트리(72)를 임데이트하여 그 업데이트된 레지스트리로부터 상기 메시지 처리기(64)로 원하는 포맷 정보를 다운로드할 수 있도록 상기 호스트 예플리케이션을 설계 및/또는 수정할 수 있다. 상기 메시지 포멧 및 메시지를 생성하고 관득하는 것은 후술하며, 상기 연급한 발명의 명칭이 "COMPUTING MACHINE HAVING IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 특허출원 제10/684,053호에 연급되어 있다.

유사하게, 파이프라인 가속기(44)의 상호점속 데이아웃을 구성하기 위해서는, 처리 유닛(62)은 상기 레기스트리(70)로부터 구성 컴웨어를 검색하고 이 컴웨어를 상기 메시지 처리기(64) 및 비스(50)를 통해 메모리(52)로 다운로드 한다. 그리고 나서 가속기(44)는 상기 메모리(52)로부터 상기 컴웨어를 다운로드할으로써 그 자신을 상호점속-구성 레시스터(도시하지 않음)로 구성한다. 처리 유닛(62)이 상기 가속기(44)를 상기 페어-벡터 미신(40)이 활성화되는 시간 마다 구성하기 때문에, 설계자는 상기 레지스트리(70)내에 저장된 컴웨어를 수정하는 것만으로 가속기(44)의 상호점속 레이아운 - 기능화(functioning) - 를 수정할 수 있다. 선택적으로, 외부 가속기-구성 라이브리리(도시하지 않음)는 가속기(44)의 다중 구성을 위한 펌웨어를 제장할 수 있고, 설계자는 상기 처리 유닛(62)이 삼기 라이브리리의 선택된 부분에서 삼기 레지스트리(70)를 업데이트라에 삼기 업데이트된 레지스트리로부터 상기 메모리(52)로 원하는 캠웨어를 다운로드할 수 있도록 상기호스트 애플리케이션을 설계 및/또는 수정할 수 있다. 또한, 외부 라이브리리 또는 레지스트리(70)는 상기 가속기(44)의 서로 다른 부분 및/또는 기능을 청의하는 펌웨이 모듈을 시청한다. 따라서, 설계자는 이를 모듈을 사용하여 가속기(44)의 선계 및/또는 수정을 용이하게 할 수 있다. 또한, 처리 유닛(62)이 이를 모듈을 사용하여 삼기 메신(40)이 메이터를 처리하는 동안 가속기(44)를 수정한다. 상기 가속기(44) 및 관웨어의 상호점속-구성은 앞서 언급한 발명의 명칭이 PROGRAMMABLE CIRCUIT AND RELATED COMPUTING MACHINE AND METHOD" 인 미국 특허출원 제10/684,057호에 더 설명되어 있다.

## [54]~[56]

상기 처리 육尺(62)은, 상기 피어-벡터 퍼진(40)이 데이터를 처리하는 동안 파이프라인 가속기(44)를 "소프트 구성" 하기도 한다. 즉, 처리 유닛(62)은 가속기의 상호접속 레이아웃을 변경하지 않고 가속기(44)의 기능을 구성한다. 그러한 소프트 구성은 후술되어 있으며 상기 연급한 발명의 명칭이 "PIPELINE ACCELERATOR FOR IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 폭력총인 제10/683,929호에 더 설명되어 있다.

## 피어-벡터 머신으로 데이터 처리

일반적으로, 피어-벡터 미신(40)은 호스트 프로세서(42)와 파이프라인 가속기(44) 간의 원 데이터의 처리를 효과적으로 분할한다. 예를 들어, 호스트 프로세서(42)는 상기 데이터와 관련된 결정-행성 연산의 대부분 또는 모두를 수행하고, 가속 기(44)는 상기 테이터상의 수학적인 집중 연산의 대부분 또는 모두를 수행한다. 그러나, 미신(40)은 이 데이터 처리를 이따 한 원하는 방법으로 분할할 수 있다.

#### 호스트 프로세서의 등작

한 실시예에서, 호스트 프로세서(42)는 원 테이터를 수신하고 그 절과인 처리된 테이터를 소나 어레이와 같은 원격 장치로 제공한다.

호스트 프로세셔(42)는 우선 입력 포트(54) 또는 버스(50)를 통해 상기 원격 장치로부터 상기 원 데이터를 수신한다. 피어-벡터 머신(40)에는 상기 수신된 원 데이터를 바퍼럽하기 위한 FIFO(도시하지 않음)가 포함되어 있다.

다음으로, 처리 유닛(62)은 파이프라인 가속기(44)에 의한 처리를 위한 상기 된 데이터를 준비한다. 예를 들어, 상기 유닛(62)은 어느 원 데이터를 가속기(44)로 전송할지 또는 어느 시원스를 가지고 상기 원 데이터를 전송할지를 결정한다. 또는, 상기 유닛(62)은 상기 원 데이터를 처리하여 가속기(44)로 전송하기 위한 중간 데이터를 생성한다. 상기 된 데이터의 준비에 대해서는 앞서 얼굴한 방법의 병칭이 "COMPUTING MACHINE HAVING IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 폭하출원 제10/684,053호에 더 설명되어 있다.

원 테이터를 준비하는 동안, 처리 속닛(54)은 가속기(44)의 기능을 수정하기 위한 하나 또는 그 이상의 "소프트-구성" 명령을 생성하기도 한다. 머신(40)이 활성화 열 때 가속기(44)의 상호접속 테이아웃을 구성하는 원웨어와는 달리, 소프트-구성 명령은 그 상호접속 레이아웃을 변경하지 않고 가속기의 구성을 제어한다. 예를 들어, 소프트-구성 명령은 가속기(44)가 처리하는 데이터 스트팅(예를 들어, 32비트 또는 64비트)의 크기를 제어한다. 가속기(44)의 소프트 구성은 앞서 연급한 발명의 명칭이 "PIPELINE ACCELERATOR FOR IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 특허출원 제10/683,929호에 더 설명되어 있다.

그러면 처리 유닛(62)은 준비된 데이터 및/또는 소프트~구성 명령을, 상기 유닛(62)과 상기 가속기(44) 사이에서 FIFO 비피로 등작하는 인터페이스 메모리(48)의 해당 위치로 로드한다.

다음으로, 에시지 처리기(64)는 상기 인터페이스 매모리(48)로부터 상기 준비된 데이터 및/또는 소프트웨이 명령을 검색하고, 상기 데이터 및/또는 명령 및 관련된 정보를 포함하는 메시지 요브젝트(message object)를 생성한다. 일반적으로, 가속기(44)는 상기 데이터/명령 및 관련된 정보를 설명하는 네 개의 식병기(집합적으로 "정보")를 필요료 하는데: a) 정보의 의도된 목적지(예를 들어, 파이프라인(74<sub>1</sub>)), b) 우선권(예를 들어, 가속기가 앞서 수신된 데이터 전후로 이 데이터를 지리해야 하는지), c) 상기 메시지 오브젝트의 길이 또는 앤드(end), 및 d) 상기 데이터의 고유 인스틴스(instance)(예를 들어, 1000 개 센세의 이레이로부터 센시 신호 번호 9), 이 결정을 속진하기 위해서, 메시지 처리기(164)는 상기 설명한 바와 같은 미리 결정된 포맷을 가지는 메시지 오브젝트를 생성한다. 준비된 테이터/소프트-구성 명령에 추가하여, 메시지 오브젝트에는 보통 네 개의 상기 연급한 식별기를 포함하고, 오프젝트가 포함하는 정보의 타입(예를 들어, 데이터, 명령)을 설명하는 식별기, 및 상기 데이터가 처리될 알고리즘을 포함하는 헤디가 포함되어 있다. 후자의 식별기는 목적지 파이프라인 (74)이 다중 알고리즘을 수행하는 경우 유용하다. 상기 처리기(64)는 인터페이스 메모리(48)로부터 상기 헤더 정보를 검색하거나 또는 준비된 데이터 또는 명령을 검색하는 인터페이스 메모리 내부의 위치에 기초하여 상기 헤더를 생성한다. 상기 메시지 왜더를 관득함으로써, 라우터(61) 및/또는 가속기(44)는 상기 메시지 오브젝트 내부의 정보를 원하는 목적지로 함하게 할 수 있고, 그 목적지가 위하는 시원으로 상기 정보를 처리하도록 하게 한다.

상기 폐시기 오보젝트를 생성하는 선택적 실시에가 있다. 예를 들어, 각각이 메시지 오보젝트가 테이터 또는 소프트-구성 명령 중 어느 하나를 포함하는 것으로 설명하였느나, 하나의 메시지 오보젝트에는 테이터와 하나 또는 그 이상으 투명 당이 모두 포함되어도 좋다. 또한, 상기 메시지 처리기(64)를 인터페이스 메도리(48)로부터 상기 테이터와 명령을 수신하는 것으로 설명하였으나, 처리 유닛(54)을 통해 직접 테이터와 명령을 수신해도 좋다.

메시지 오브젝트의 생성에 대해서는 앞서 인급한 발명의 명칭이 "COMPUTING MACHINE HAVING IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 특허총된 제10/684,053호에 더 설명되어 있다.

#### 파이프라인 가속기

화이프라인 가속기(44)는 메시지 처리기(64)로부터 메시지 오브젝트를 수신하고 판독하며 상기 오브젝트 내부의 테이터 및/또는 명령을 원하는 목적지로 유효하게 향하도록 한다. 이 기술은 상기 처리 유닛(62) 및 파이프라인(74)에 의해 수행되는 알고리즘의 수가 상대적으로 적은 경우 특히 유용해서, 라우터(61)를 생략할 수 있다. 선택적으로, 상기 처리 유닛(62)에 의해 수행되는 알고리즘의 수 또는 파이프라인(74)의 수가 상대적으로 큰 경우에는, 라우터(61)가 상기 메시지 처리기(64)로부터 메시지 오브젝트를 수신하고 환독하고 상기 오브젝트 내부의 테이터 및/또는 명령이 가속가(44) 내부의 원하는 목적기로 유효하게 함하도록 한다.

한 실시예에서, 처리~유닛 알고리즘 및 파이프라인(74)의 수가 적은 경우, 각각의 파이프라인은 메시지 오브랙트를 통시에 수신하고 상기 해더를 분석하여 그것이 상기 메시지의 원하는 수신육인지 아닌지를 결정한다. 만일, 메시지 오브랙트가 목정 파이프라인(74)으로 의도된 것이라면, 그 파이프라인은 그 메시지를 판독하고 복구된 테이터/명령을 처리한다. 그러나, 만약 상기 메시지 오브랙트가 목정 파이프라인(74)으로 의도되지 않았다면, 그 파이프라인은 상기 메시지 오브랙트를 무시한다. 예를 들어, 메시지 오브랙트가 파이프라인(74)에 의해 처리되는 테이터가 포함되어 있다고 가정한다. 따라서, 상기 파이프라인(74)은 상기 메시지 해더를 분석하고, 그것이 테이터를 위한 의도된 목적지임을 결정하고, 상기 메시지로 부터 테이터를 복구하고, 상기 복구된 테이터를 처리한다. 반대로, 상기 파이프라인(74,~74,) 각각은 상기 메시지 해더를 분석하고 그것이 상기 테이터를 위한 의도된 목적지가 아님을 결정해서, 그 테이터를 복구 또는 처리하지 않는다. 만일 상기 메시지 오브젝트 내무의 테이터를 위한 의도된 목적지가 아님을 결정해서, 그 테이터를 복구 또는 처리하지 않는다. 만일 상기 메시지 오브젝트 내무의 테이터가 다룬 파이프라인(74)을 위한 것이라면, 메시지 처리기(64)는 통일한 테이터를 포함하는 각각의 메시지 오브젝트의 시퀀스, 각각의 목적지 파이프라인을 위한 하나의 메시지를 생성하고 전송한다. 선택적으로, 메시지 치리기(64)는, 목적지 파이프라인 모두를 식별하는 해더를 가지는 하나의 메시지 오브젝트를 권충함으로써, 상기 테이터를 목착지 파이프라인(74,~74,) 모두로 통시에 상기 테이터를 전송한다. 메시지 오브젝트로부터 테이터 및 소프트~무성 명령을 복구하는 것은 앞서 언급한 발명의 명칭이 "PIPELINE ACCELERATOR FOR IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 목적음원 제10/683,929호에 더 설명되어 있다.

다른 실시에에서, 처리-유닛이 프로세성 또는 파이프라인(74)이 다수인 경우, 각각의 파이프라인은 라우터(61)로부터 메시지 오브젝트를 수신한다. 비뜩 라우터(61)가 타켓 파이프라인(74)으로만 메시지 오브젝트를 이상적으로 진송해야 하지만, 상기 타켓 파이프라인은 제속 헤더를 분석하고 그것이 상기 메시지의 의도된 수신속인지 아닌지를 결정한다. 그러한 결정으로 참제적인 메시지 라우팅 에너, 예를 들어, 예의를 식별한다. 면일 메시지 오브젝트가 타켓 파이프라인(74)을 위한 것이라면, 그 파이프라인은 메시지를 판독하고 복구된 데이터/명명을 처리한다. 그러나, 만일 메시지 오브젝트가 타켓 파이프라인(74)을 위한 것이 아니라면, 그 파이프라인은 상기 메시지 오브젝트를 위한 처리를 투시하고 예의 라우팅이 생성했음을 나타내는 세로운 메시지를 호스트 프로세서(42)로 발행한다. 라우팅 예외의 처리에 대해서는 앞서 언급한 발명의 명칭이 "COMPUTING MACHINE HAVING IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 특허출원 제10/684,053호에 설명되어 있다.

다음으로, 파이프라인 가속기(44)는 상기 매시지 오브젝트로부터 복구되어 입력 데이터 및/또는 명령을 처리한다.

데이터를 위해, 상기 목적지 과이프라인 또는 파이프라인들(74)은 상기 데이터상의 연산 또는 연산들을 수행한다. 또 2를 참고로 설명한 바와 같이, 과이프라인(74)은 프로그램 명령을 실행하지 않으므로, 과이프라인은 상기 파이프라인 클목의 주과수와 거의 동일한 레이트로 상기 데이터를 처리할 수 있다.

제1 실시예에서, 하나의 파이프라인(74)이 상기 일찍 데이터를 처리함으로써 결과 데이터를 생성한다.

제2 실시에에서, 다수의 파이프라인(74)이 상기 임력 테이터를 직렬로 처리함으로써 결과 데이터를 생성한다. 예를 들어, 파이프라인(74)은 상기 입력 테이터에서 제1 연산을 수행하여 제1 중간 테이터를 생성한다. 다음으로, 파이프라인(74<sub>2</sub>)이 상기 제1 중간 테이터상에서 제2 연산을 수행하여 제2 중간 데이터를 생성하고, 이렇게 순서대로 그 개인 내의 최종 파이프라인(74)이 상기 결과 데이터를 생성할 때 까지 진행된다.

제3 실시에에서, 다수의 파이프라인(74)은 상기 입력 테이터를 병열고 처리함으로써 삼기 결과 테이터를 생성한다. 예를 들어, 파이프라인(74<sub>1</sub>)은 상기 입력 테이터의 첫번째 세트에서 제1 연산을 수행함으로써 결과 테이터의 제1 세트를 생성한다. 같이 시간에서, 파이프라인(74<sub>2</sub>)은 상기 입력 테이터의 두번째 세트에서 제2 연산을 수행함으로써 결과 테이터의 제2 세트를 생성한다. 이하 같은 방식으로 진행된다.

선택적으로, 파이프라인(74)은 삼기 세 개의 실시예의 어느 조합에 따라 상기 입력 테이터로부터 결과 테이터를 생성한다. 예를 들어, 파이프라인(74<sub>2</sub>)은 상기 입력 테이터의 첫번째 세트에서 제1 연산을 수행함으로써 결과 테이터의 제1 세트를 생성한다. 동시에, 파이프라인(74<sub>2</sub> 및 74<sub>4</sub>)은 상기 입력 테이터의 두번째 세트에서 제2 및 제3 연산을 적별로 수행함으로써 결과 데이터의 제2 세트를 생성한다.

상기 실시에 및 선택안 중 이느 것에서, 하나의 피이프리인(74)은 다중 인산을 수행한다. 예를 들어, 피이프리인(74<sub>1</sub>)은 데이터를 수신하고, 상기 수신된 데이터에서 제1 인산을 수행함으로써 제1 중간 데이터를 생성하고, 상기 제1 중간 데이터를 입시 저장하고, 상기 제1 중간 데이터에서 제2 인산을 수행함으로써 제2 중간 데이터를 생성하고, 이후 최품 데이터가 생성될 때 까지 진행된다. 파이프라인(74<sub>1</sub>)이 삼기 제1 인산을 수행하는 것부터 상기 제2 인산, 등등을 수행하는 것 까지 소위치를 하게 하는 다양한 기술들이 있다. 그리한 기술은 앞서 연급한 발명의 명칭이 "PIPELINE ACCELERATOR FOR IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 특허출원 제10/683,929호(대리인 관리번호 1934~13~3)에 설명되어 있다.

소프트-구성 명령을 위해서, 가속기(44)는 메시지 해더에 의한 표시된(도시하지 않음)대응하는 소프트-구성 레지스터내의 비트를 설정한다. 상기 설명한 마와같이, 일반적으로 이를 비트를 설정하는 것은 이 비트에 그것의 상호점속 레이아웃을 변화시키지 않고 가속기(44)의 기능을 변화시킨다. 이것은 의부 편을 입력된 또는 출력편으로 설정하거나 또는 어트레성 모드를 설정하기 위해 프로세서의 제이 레지스터 내의 비트를 설정하는 것과 유사하다. 또한, 가속기(44)에 의해 수행된 더 다른 소프트-구성 명령 또는 연산은 메이터를 소프트-구성된 레지스터 또는 테이블로 데이터를 모드한다. 가속기(44)에 소프트-구성은 앞서 인급한 발명의 명칭이 "PIPELINE ACCELERATOR FOR IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 특허출된 제10/683,929호에 더 설명되어 있다.

다음에, 파이프라인 가속기(44)는 그 이후의 처리를 위해 라우터(61)(또는 라우터가 생략되면)를 경유하여 호스트 프로세서(42)에 경과 테이터를 제공한다.

선택적으로, 가속기(44)는 적접적으로 출력 포트(60)를 경유하거나 또는 간접적으로 라우터(61)(만월 있는 경우), 버스 (50), 호스트 프로세서(42) 및 출력 포트(58)를 경유하여 원격 목적지(도 5)에게 그 절과 데이터를 제공한다. 따라서, 이 선 택적인 실시에에서, 가속기(44)에의해 생성된 결과 데이터가 최종 처리된 데이터이다.

가속기(44)가 상기 철과 데이터를 효스트 프로세서(42)로 제공하면 - 그 이상의 처리로 또는 원격 장치(도 5)를 통과시키는 -, 메시지 치리기(64)에 의해 생성된 메시지 오브젝트와 동일한 포맷을 갖는 메시지 오브젝트 내에 이 데이터를 건송한다. 메시지 처리기(64)에 의해 생성된 메시지 오브젝트들에는 결과 데이터의 목적지 및 우선순위를 특정하는 해더들을 포함한다. 예를 들면, 해더는 포트(58)를 경유하여 원칙 장치에 결과 데이터를 통과시키기 위하여 메시지 처리기(64)에게 명령하기도 하거나, 또는, 처리 유닛(62)에 의해 실행된 프로그램의 어떤 부분이 데이터의 제어를 처리하도록 특정하기도 한다. 동일한 메시지 포맷을 사용함으로써, 가속기(44)는 효스트 프로세서(42)와 동일한 인터페이스 제품을 가지고 있다. 이것은 피어~벡터 미신을 디자인하고 수정하는 것을 용이하게 해 주고, 특히, 만약 인터페이스 제품이 업제 표준일 경우 그러하다.

파이프라인 가속기(44) 및 파이프라인(66)의 구조와 등작은 앞서 연급한 방명의 명칭이 "PIPELINE ACCELERATOR FOR IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 목처율현 제10/683.929호에 더 설명되어 있다.

## 호스트 프로세서器 가지고 파이프라인 가속기로부터의 수신 및 처리

가속기(44)로부터 메시지 오브팩트를 수신하는 경우, 메시지 처리기(64)는 우선 메시지 헤더를 관득하고 복구된 데이터 를 표시된 목적지로 안내한다.

만약, 상기 헤디가 상기 데이터가 포트(58)를 통해 원격 장치(도 5)로 통화할 것임을 나타낸다면, 메시지 처리기(64)는 그 데이터를 포트(58)로 직접 제공하거나 또는 인터페이스 메모리(48) 또는 삼기 버피로부터 상기 포트(58)까지 다른 메모리내에 형성된 포트 FIFO 버퍼(도시하지 않음)로 제공한다. 다중 포트(58) 및 다수의 각각 원격 장치들도 예상된다.

그러나, 만약 해더가 상기 처리 유닛(62)이 상기 데이터를 더 처리해야 함을 나타낸다면, 메시지 처리기(62)는 이 테이터를 상기 데이터의 처리를 제어하는 처리-유닛 프로그램의 일부에 대응하는 인터페이스 메모리(48)의 위치내에 저장한다. 보다 독립하게는, 동일한 해비가 상기 처리 유닛(54)에 의해 실행된 프로그램의 일부가 상기 데이터의 처리를 제어하는지를 표시한다. 따라서, 메시지 처리기(64)는 상기 테이터를 이 프로그램 부분에 대응하는 인터페이스 메모리(48)의 위치(FIFO 같은)에 저장한다.

상기 설명한 바와 같이, 인터페이스 메모리(48)는 상기 가속기(44)와 처리 유닛(42) 사이의 버퍼로서 작동하고, 그래서 처리 유닛(62) 보다 데이터 처리를 빨리하는 경우 생성한다. 인터페이스 메모리(48)를 사용함으로써, 가속기(44)는 처리 유닛(62)보다 데이터 처리를 빨리하는 경우 생성한다. 인터페이스 메모리(48)를 사용함으로써, 가속기(44)는 처리 유닛(62)의 늦은 응답에 오해 눌취기지 않는다. 이것은 또한 처리 유닛의 핸플링 인터럼트로의 응답 시간이 부정확한 것과 관련된 유효하지 않은 패널터(penalty)를 막아준다. 상기 가속기(44)의 처리 유닛(62)에 의한 부정확한 처리는 출리 메시지가 설계자에게 a) 핵업 출력 메시지를 위한 처항 및 처리, 또는 b) 핵업 메시지가 접처 쓰여지는 것을 막기 위한 파이프라 인 전체의 아이들링(idling) 제어 중 어느 하나를 강요하여 가속기의 설계를 불필요하게 복잡하게 할 것이다. 따라서, 가속기(44)의 처리 유닛(62) 사이의 비퍼로서 등작하는 인터페이스 메모리(48)를 사용하는 것은 a) 가속기의 설계를 쉽게하고, b) 가속기에 기반시설 요구를 줄여주고 보다 큰 PLIC 메졸리케이션로 유지할 수 있고, c) 가속기가, 출력 데이터가 더 느린 프로세서에 의해 "막히지(blocked)" 당기 때문에 빠른 구동으로 등물적이 되는 다양한 장점을 가지게 된다.

그래서, 메시지 처리가(64)가 인터페이스 메모리(48)내에 시장하는 데이터를 위해, 처리 유낮(62)은 상기 인터페이스 메모리(48)를 풀(poll)하여 새로운 데이터가 특정 위치에 도달한 경우 또는 메시지 처리가(64)가 데이터의 도달의 처리 유낮을 인식하는 인터립트 또는 다른 신호를 생성하는 매를 결정한다. 한 실시에에서, 처리 유낮(62)이 데이터를 검색하기 전에, 메시지 처리가(64)는 상기 데이터를 포함하는 메시지 오보제트를 생성한다. 좀 더 특별하게, 실제자는 처리 유낮(62)에 의해 실행된 프로그램을 설계하여 메시지 오보제트 내에 데이터를 수신하게 한다. 따라서, 메시지 처리가(64)는 데이터만을 지장하는 대신 인터페이스 메모리(48)내에 메시지 오보제트를 저장할 수 있다. 그러나, 메시지 오보제트는 보통 데이터가 포함되어 있는 것 보다 상당히 많은 메모리를 점유하고 있다. 따라서, 메모리를 절약하기 위해서는, 메시지 처리가(64)는 파이프라인 가속기(44)로부터 메시지 오보제트를 관득하고, 메모리(48) 내에 상기 데이터를 지장하고, 그 다음, 처리 유낮(62)이 메이터를 수신할 준비가 되면 메시지 오브제트를 전목하고, 메모리(48) 내에 상기 데이터를 지장하고, 그 다음, 처리 유낮(62)이 메이터를 여시지 해더내에 식별된 프로그램 부분의 제이하에 처리한다.

다음으로, 처리 유닛(62)은 프로그램의 목적지 부분의 제어하여 상기 검색된 데이터를 처리하고, 처리된 데이터를 생성하고, 이 처리된 데이터를, 상기 처리된 데이터의 의도된 목적지에 대응하는 인터페이스 메모리(48)의 위치에 지장한다.

이어서, 메시지 처리가(64)는 상기 처리된 테이터를 검색하고 이를 표기된 목적지로 제공한다. 처리된 데이터를 검색하기 위해서, 메시지 처리가(64)는 메모리(48)를 돌하여 상기 데이터가 언제 도달했는지, 또는 처리 유닛(62)이 인터럽트 또는 다른 신호로서 상기 데이터의 도달을 메시지 처리가에에 동보했는지를 결정한다. 상기 처리된 데이터를 의도된 목적지로 제공하기 위해서, 메시지 처리가(64)는 상기 테이터를 포함하는 메시지 오브젝트를 생성하고, 이 메시지 오브젝트를 상기 데이터의 더 이상의 처리를 위해 가속가(44)로 되돌려 보낸다. 또는, 상기 처리가(64)는, 처리 유닛(62)에 의한 더 이상의 처리를 위해 상기 테이터를 포트(58) 또는 상기 메모리(48)의 다른 위치로 전송한다.

가속기(44)로부터 데이터의 상기 호스트 프로세서의 수신 및 처리는 앞서 연급한 방향의 병칭이 "COMPUTING MACHINE HAVING IMPROVED COMPUTING ARCHITECTURE AND RELATED SYSTEM AND METHOD" 인 미국 목하습된 제10/684,053호에 더 설명되어 있다.

## 피어-벡터 머신을 이용한 더 다른 처리 기술

도 3을 계속 참고하면, 호스트 프로세서(44)가 데이터를 수신하고 처리한 다음 이 데이터를 더 다른 처리를 위해 파이프라인 가속기(44)로 전송하는 상기 설명한 실시에와 다른 예가 있다.

한 대안에서는, 호스트 프로세서(44)가 상기 데이터의 적어도 일부의 처리를 모두 수행하고는 이 데이터를 더 다른 처리 를 위해 과이프라인 가속기(44)로 전송하지 않는다. 더 다른 대안에서는, 파이프라인 가속기(44)가 포트(56)를 통해 원격 장치(도 5)로부터 직접 원 테이터를 수신하고 상기 된 데이터를 처리한다. 가속기(44)는 상기 처리된 데이터를 포트(60)를 통해 상기 원격 장치로 직접 되돌려 보내거나 또는 더 나쁜 처리를 위해 상기 호스트 프로세서(44)로 전송한다. 후자의 경우, 가속기(44)는 상기 설명한 바와 같이 메시지 오 브페트에 상기 데이터를 캡슐화(encapsulate)한다.

- 더 다른 대안에서는, 가속기(44)에, 하드라이어도 파이프라인(74)에 더해서, 디지털 신호 처리기(DSP)와 같은 하나 또는 그 이상의 명령-실행 프로세서를 포함시켜 파이프라인의 수-크린천 가능성을 수행한다.

#### 피어~벡터 머신의 예시적 수행

도 3을 계속 참고하면, 한 실시에에서, 파이프라인 비스(50)는 표준 133MHz PCI 비스이고, 파이프라인(74)에는 하나 또는 그 이상의 표준 PMC 카드가 포함되어 있으며, 메모리(62)는 각각이 개계의 PMC 카드상에 위치하는 플래쉬 메모리이다.

## 피어~벡터 미신의 예시적 메폴리케이션

도 4는 본 발명의 일 실시에에 따른 피어~백터 며신(40)을 통합하는 소나 시스템(80)의 불력 다이어그램이다. 며신(40)에 대하여, 상기 시스템(80)에는 소나 신호를 송수신하는 변환 소자(transducer element)(84, ~84, ), 디지털~아날로그 변환기(DAC)(86, ~86, ), 아날로그-디지털 변환기(ADC)(88, ~88, ) 및 데이터 인터페이스(90)이 포함되어 있다. 소나 신호를 생성하고 처리하는 것은 종종 수학적으로 집중되는 기능이기 때문에, 미신(40)은 이러한 기능들을 종래의 집유령 미신 ~도 1의 다중~프로세서 미신(10)과 같은 ~ 이 도 3을 참고로 상기 설명한 바와 같이 주어진 물목 주파수에서 할 수 있는 것보다 빠르고 유효하게 수행할 수 있다.

연산의 전송 모드 동안, 어레이(82)는 소나 신호를 돌과 같은 매체(도시하지 않음)로 전송한다. 먼저, 피어-벡터 이신(40)은 온 포트(92)상에서 수신된 원 신호 레이터를 삼기 어레이 소자(84) 각각의 하나를 위한 n 디지털 신호로 변환한다. 이들 신호의 크기와 위상은 어레이(82)의 전송-법 제턴을 나타낸다. 다음으로, 머신(40)은 이를 디지털 신호를, 이들 신호를 각각의 DAC(86)에 제공하여 각각의 아날로그 신호로 변환하는 인터페이스(90)로 제공한다. 예를 들어, 인터페이스(90)는 머선(40)으로부터 상기 디지털 신호를 적별로 수신하고, 이들의 n 개 모두를 수신하고 매괴할 때 까지 이를 신호를 저장하고, 이들 순차적인 신호를 각각의 DAC(86)으로 동시에 제공하는 버피 역할을 한다. 그리고 나서, 변환 소자(84)가 이들 아날로그 신호를 소나 신호의 법을 형성하기 위해 상호 간섭하는 각각의 음과로 변환한다.

연산의 수선 모드 동안에, 어레이(82)는 상기 메레(도시하지 않음)로부터 소나 신호를 수신한다. 수신된 소나 신호는 원적 오브랙트에 의해 반사된 상기 전송된 소나 신호의 일부 및 환경 및 상기 원적 오브랙트에 의해 방출된 사유도 에너지로 구성되어 있다. 우선, 변환 소자(84)가 상기 소나 신호를 구성하는 각각의 음과를 수신하고, 이들 음과를 n개의 아날로그 신호로 변환하고, 이들 아날로그 신호를 n개의 각각의 디지털 신호로 변환을 위해 ADC(88)로 제공한다. 다음으로, 인터페이스(90)가 이를 디지털 신호를 피어-벡터 먹신(40)으로 제공하여 처리되게 한다. 예를 들어, 인터페이스(90)는 ADC(88)로부터 상기 디지털 신호를 병원로 수신한 다음 이들 신호를 먹신(40)으로 리털로 제공하는 이피로서 동각한다. 상기 디지털 신호에서 상기 막신(40)이 수행하는 처리는 어래이(82)의 수신-병 패턴을 나타낸다. 월터링, 벤트 시프팅, 스펙트럼 변환(푸리에 변환 등), 및 콘볼투션과 같은 추가적인 처리 단계가 상기 디지털 신호레 적용된다. 그리고 나서 먹신(40)은 포트(94)를 통해 상기 처리된 데이터를 디스플레이 강치와 같은 다른 장치로 제공하여 위치한 오브랙트를 볼 수 있게 한다.

소나 시스템(80)을 참고로 설명하였으나, 소나 시스템 이외의 시스템도 피어~벡터 머신(40)에 통합된다.

알의 설명으로부터 당업자는 본 발명을 실시하거나 활용할 수 있다. 본 발명의 실시예들을 당업자는 다양하게 변형시킬 수 있다는 것은 분명하고, 본 발명의 요지와 범위를 벗어나지 않고 다른 실시에 및 응용 분야에 적용할 수 있다. 따라서, 본 발명의 실시예들은 본 발명을 제한하기 위한 것이 아니고 여기에서 공개한 원리와 특징에 넓게 해석되야 할 것이다.

(57) 374 99

#### 청구항 1.

프로그램을 실행하고, 상기 프로그램에 불답하여 재1 호스트 데이터를 생성하도록 통작 가능한 호스트 프로세어: 및

상기 호스트 프로세서와 결합되고, 상기 제1 호스트 네이터를 수신하고 상기 제1 호스트 네이터로부터 제1 파이프라인 데이터를 생성하도록 통작 가능한 파이프라인 가속기를 구비하는 것을 특징으로 하는 피어-벡터 미신.

## 청구항 2.

정구항 1에 있어서,

상기 호스트 프로세서는,

제2 데이터를 수심하고,

상기 제2 데이터로부터 제1 호스트 데이터를 생성하도록 통하 가능한 것을 특징으로 하는 피어~벡터 며신.

# 청구함 3.

성구항 1예 있어서.

상기 호스트 프로세시는,

상기 파이프라인 가속기로부터 상기 제1 파이프라인 데이터를 수신하고,

상기 제1 파이프라인 데이터를 처리하도록 통작 가능한 것을 특징으로 하는 피어~벡터 머신.

## 청구함 4.

정구항 1예 있어서.

상기 호스트 프로세서는.

상기 제1 파이프라인 가속기로부터 상기 제1 파이프라인 데이터를 수신하고,

상기 제1 파이프라인 데이터로부터 상기 제1 호스트 데이터를 생성하도록 등작 가능한 것을 특정으로 하는 피어-벡터 머선.

## 청구항 5.

청구항 1에 있어서.

상기 호스트 프로세서 및 상기 파이프라인 가속기와 절합되어 있고 제1 메모리부를 가지는 인터메이스 메모리를 더 구비하고,

상기 호스트 프로세서는,

상기 제1 메모리부내에 상기 제1 호스트 테이터를 저장하고,

상기 제1 호스트 테이터를 상기 제1 메모리부르부터 삼기 파이프라인 가속기로 제공하도록 등작 가능한 것을 특징으로 하는 피어-벡터 머신.

## 청구함 6.

청구함 1에 있어서.

생기 호스트 가속기 및 생기 파이프라인 가속기와 절합되어 있고 제1 및 제2 메모리부용 가지는 인터페이스 메모리용 더구비하고,

상기 호스트 프로세서는,

상기 계1 메모리부 내에 상기 제1 호스트 데이터를 시장하고,

성기 제1 호스트 메모리를 생기 제1 메모리부로부터 성기 파이프라인 가속기로 제공하고,

상기 파이프라인 가속기로부터 삼기 제1 파이프라인 테이터를 수신하고,

상기 제2 제모리부 내대 상기 제1 파이프라인 데이터를 저장하고,

상기 제2 메모리부묘부터 상기 호스트 프로세서까지 상기 제1 파이프라인 데이터를 검색하고, 그리고

상기 제1 파이프라인 데이터를 처리하도록 등작 가능한 것을 특징으로 하는 피어-벡터 머신.

# 청구항 7.

청구항 1에 있어서,

상기 호스트 프로세서는 상기 파이프라인 가속기를 구성하도록 통과 가능한 것을 특징으로 하는 피어~백터 며신.

#### 청구항 8.

정구항 1에 있어서.

상기 파이프라인 가속기는 프로그램가능한-로직 집적회로를 포함하는 것을 특징으로 하는 피어-벡터 머신,

## 청구항 9.

제1 파이프라인 데이터를 생성하도록 등작 가능한 파이프라인 가속기; 및

상기 파이프라인 가속기와 경합되고 프로그램을 실행하도록 통작 가능하며, 상기 프로그램에 응답하여 상기 제1 파이프라인 데이터를 수신하고 상기 제1 파이프라인 데이터로부터 제1 호스트 데이터를 생성하도를 통작 가능한 것을 목정으로 하는 피어-벡터 미신.

## 청구항 10.

정구항 9에 있어서.

상기 파이프라인 가족기는,

제2 테이티를 수신하고,

상기 제2 데이터로부터 상기 제1 파이프라인 데이터를 생성하도록 통과 가능한 것을 특징으로 하는 피어-벡터 퍼신.

## 청구학 11.

정구항 9예 있어서,

상기 파이프라인 가속기는,

성기 호스트 프로세시로부터 상기 제1 호스트 데이터를 수신하고,

성기 제1 意스트 데이터를 처리하도록 통과 가능한 것을 특징으로 하는 괴어-벡터 여선.

## 청구항 12.

정구항 9에 있어서.

상기 과이프라인 가속기는,

상기 호스트 프로세서로부터 상기 제1 호스트 데이터를 수신하고,

· 상기 제1 호스트 데이터로부터 상기 제1 파이프라인 데이터를 생성하도록 등작 가능한 것을 특징으로 하는 피어·벡터 머 신.

## 청구학 13.

청구항 9에 있어서,

상기 파이프라인 가속기 및 상기 호스트 프로젝서와 결합되고 제1 메모리부를 갖는 인터페이스 메모리를 더 구비하고,

상기 호스트 프로세시는,

상기 파이프라인 가속기로부터의 상기 제1 파이프라인 데이터를 상기 제1 메모리부 내에 저장하고,

살기 제1 메모리무료부터 살기 제1 과이프라인 데이터를 검색하도록 등작 가능한 것을 특징으로 하는 피어-벡터 먹신.

## 청구함 14.

정구항 9에 있어서,

상기 파이프라인 가속기 및 상기 호스트 프로세서와 절합되고 제1 및 제2 메모리부를 가기는 인터페이스 메모리를 더 구비하고,

상기 호스트 프로세서는,

성기 파이프라인 가속기로부터의 상기 제1 파이프라인 테이터를 상기 제1 때모리부 내로 저장하고,

상기 제1 부르부터 상기 제1 파이프라인 데이터를 검색하고.

상기 제2 제모리부 대에 상기 제1 호스트 데이터를 저장하고,

상기 제2 메모리부로부터의 상기 제1 호스트 테이터를 상기 파이프라인 가속기에 제공하도록 통작하능하며,

상기 파이프라인 가속기는 상기 제2 메모리부로부터 수신된 상기 제1 호스트 테이터를 거리하도록 통작 가능한 것을 푹 정으로 하는 피어-벡터 머신.

## 청구항 15.

경구항 9에 있어서.

상기 호스트 프로세시는 상기 파이프라인 가속기를 구성하도록 돌작 가능한 것을 특징으로 하는 피어~백터 마신.

## 청구항 16.

원 데이터를 생성하도록 등과 가능한 장치:

상기 장치와 결합되어 있고 프로그램을 실행할 수 있으며, 상기 프로그램에 등답하여 상기 된 데이터로부터 호스트 데이터를 생성하도록 등작 가능한 호스트 프로세서: 및

상기 호스트 프로세시와 결합되어 있고 상기 호스트 데이터를 수신하도록 등과 가능하며 상기 호스트 데이터로부터 파이 프라인 데이터를 생성하도록 등작 가능한 파이프라인 가속기를 구비하는 것을 특징으로 하는 시스템.

#### 청구학 17.

원 데이터를 생성하도록 등작 가능한 강치;

상기 장치와 결합되어 있고 상기 된 테이터로부터 파이프라인 테이터를 생성하도록 통작 가능한 파이프라인 가속기; 및

상기 파이프라인 가속기와 결합되어 있고 프로그램을 실행하도록 등작 가능하며, 상기 프로그램에 음납하여, 상기 파이 프라인 데이터를 수신하고 상기 파이프라인 데이터로부터 호스트 데이터를 생성하도록 등작 가능한 호스트 프로세시를 구 비하는 걸을 특징으로 하는 시스템.

## 청구항 18.

파이프라인 가속기를 가지고 상기 제1 호스트 데이터로부터 제1 파이프라인 데이터를 생성하는 단계를 구비하는 것을 복장으로 하는 방법,

## 청구항 19.

청구항 18에 있어서,

원 데이터를 수신하는 단계를 더 구비하고,

상기 제1 호스트 테이터를 생성하는 단계는 상기 원 데이터로부터 상기 제1 호스트 데이터를 생성하는 단계를 포함하는 것을 폭질으로 하는 방법.

#### 청구항 20.

청구항 18에 있어서.

상기 제1 호스트 테이터를 생성하는 단계는 상기 제1 파이프라인 테이터트부터 상기 제1 호스트 테이터를 발세하는 단계 를 포함하는 것을 특징으로 하는 방법.

## 청구항 21.

경구항 18에 있어서.

상기 호스트 프로세서를 가지고 상기 프로그램을 실행하여 상기 제1 파이프라인 데이터로부터 제2 호스트 데이터를 생성시키는 단계를 더 구비하는 것을 특징으로 하는 방법.

## 청구항 22.

청구항 18에 있어서,

상기 호스트 프로세서를 가지고 상기 프로그램을 실행하여 상기 파이프라인 가속기를 구성하는 단계를 더 구비하는 것을 목정으로 하는 방법,

## 청구항 23.

파이프라인 가족기를 가지고 제1 파이프라인 테이터를 생성하는 단계: 및

호스트 프로세서를 가지고 프로그램을 실행하여 상기 제1 파이프라인 데이털부터 제1 호스트 데이터를 생성하는 단계를 구비하는 것을 특징으로 하는 방법.

#### 청꾸항 24.

청구항 23에 있어서,

원 데이터를 수신하는 단계를 더 구비하고,

상기 제1 파이프라인 데이터를 생성하는 단계는 상기 원 데이터로부터 상기 제1 파이프라인 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 방법.

# 청구항 25.

청구항 23에 있어서,

상기 제1 파이프라인 테이터를 생성하는 단계는 상기 제1 호스트 테이터로부터 상기 제1 파이프라인 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 방법.

# 청구항 26.

청구항 23에 있어서,

상기 파이프라인 가속기를 가지고 상기 제1 호스트 데이터로부터 제2 파이프라인 데이터를 생성하는 단계를 더 구비하는 것을 특징으로 하는 방법,

## 청구함 27.

정구항 23에 있어서,

상기 호스트 프로세서를 가지고 삼기 프로그램을 실행하여 상기 파이프라인 가속기를 구성하는 단계를 더 구비하는 것을 특징으로 하는 방법,

20.08

X 93.1





35.833



